Analyse und Vorhersage der Aktualisierungen von Web-Feeds
نویسنده
چکیده
Feeds werden u. a. eingesetzt, um Nutzer in einem einheitlichen Format und in aggregierter Form über Aktualisierungen oder neue Beiträge auf Webseiten zu informieren. Da bei Feeds in der Regel keine Benachrichtigungsfunktionalitäten angeboten werden, müssen Interessenten Feeds regelmäßig auf Aktualisierungen überprüfen. Die Betrachtung entsprechender Techniken bildet den Kern der Arbeit. Die in den verwandten Domänen Web Crawling und Web Caching eingesetzten Algorithmen zur Vorhersage der Zeitpunkte von Aktualisierungen werden aufgearbeitet und an die spezifischen Anforderungen der Domäne Feeds angepasst. Anschließend wird ein selbst entwickelter Algorithmus vorgestellt, der bereits ohne den Einsatz spezieller Konfigurationsparameter und ohne Trainingsphase im Durchschnitt bessere Vorhersagen trifft, als die übrigen betrachteten Algorithmen. Auf Basis der Analyse verschiedener Metriken zur Beurteilung der Qualität von Vorhersagen erfolgt die Definition eines zusammenfassenden Gütemaßes, welches den Vergleich von Algorithmen anhand eines einzigen Wertes ermöglicht. Darüber hinaus werden abfragespezifische Attribute der Feed-Formate untersucht und es wird empirisch gezeigt, dass die auf der partiellen Historie der Feeds basierende Vorhersage von Änderungen bereits bessere Ergebnisse erzielt, als die Einbeziehung der von den Diensteanbietern bereitgestellten Werte in die Berechnung ermöglicht. Die empirischen Evaluationen erfolgen anhand eines breitgefächerten, realen FeedDatensatzes, welcher der wissenschaftlichen Gemeinschaft frei zur Verfügung gestellt wird, um den Vergleich mit neuen Algorithmen zu erleichtern.
منابع مشابه
Medizinischer Erkenntnisgewinn aus vernetzten Datenbanken
Bei einer Wissensverdopplung der Medizin von unter 10 Jahren ist ein medizinischer Erkenntniszuwachs zwangsläufig auch auf die Analyse historischer Daten angewiesen. Die dem vorliegenden Beitrag zugrunde liegenden Datenbanken umfassen die Krankheitsbilder des Mammakarzinoms, Bronchialkarzinoms, kolorektalen Karzinoms, der verkapselnden Peritonealsklerose und der Riesenzellarteriitis. Folgende A...
متن کاملFarbanalyse von gebackenen oder frittierten Nahrungsmitteln und Vorhersage des Acrylamid-Wertes
Zusammenfassung. Ein System zur automatischen Farbanalyse von gebackenen oder frittierten Nahrungsmitteln wurde realisiert, mit dem der Farbcharakter der Prüfobjekte nach international definierten Standards (Agtron-Klassifizierung) untersucht werden kann. Die Probe wird nach dem flächenmäßigen Anteil der verschiedenen Braunfärbungen (Agtron-Klassen) bewertet. Die Trennung von Objektbereichen un...
متن کاملInfluence of the soil structure and property contrast on flow and transport in the unsaturated zone
xix Zusammenfassung xxi 0.1 Einfluss von Struktur auf die Schätzung effektiver Parameter und Bewertung der Annahmen bei der Modellierung von Strömungsprozessen unter Gleichgewichtsbedingungen (Frage 1 und 2) . . . xxiii 0.2 Analyse der Zeitskalen für Strömungsprozesse unter Nicht-Gleichgewichtsbedingungen und Untersuchung der Bedeutung von Grenzflächen während der Drainage . . . . . . . . . . ....
متن کاملVerteilte Messung und Vorhersage von Kanalauslastung in IEEE 802.11 Wireless LAN
Aufgrund der hohen Verbreitung und intensiven Nutzung von WLAN kommt es insbesondere in Bereichen mit hoher Gerätedichte (wie z. B. universitären Lehrgebäuden) schon heute zu Kapazitätsengpässen, die durch ausgelastete Funkkanäle verursacht werden. Eine Vorhersage der Funkkanalauslastung kann die Probleme durch bessere Nutzung der vorhanden Spektrumsressourcen und proaktive Anpassung genutzter ...
متن کاملPageBeat - Zeitreihenanalyse und Datenbanken
Zeitreihendaten und deren Analyse sind in vielen Anwendungsbereichen eine wichtiges Mittel zur Bewertung, Steuerung und Vorhersage. Für die Zeitreihenanalyse gibt es eine Vielzahl von Methoden und Techniken, die in Statistiksoftware umgesetzt und heutzutage komfortabel auch ohne eigenen Implementierungsaufwand einsetzbar sind. In den meisten Fällen hat man es mit massenhaft Daten oder auch Date...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2012